چرا باید به توسعه مدل‌های زبانی بومی توجه کرد؟

امروزه با گسترش هوش مصنوعی مدل‌های زبانی بزرگ کاربردهای فراوانی پیدا کرده‌اند و به‌شکل گسترده در ترجمه، تولید محتوای خودکار، تشخیص احساسات متون و بسیاری دیگر مورد استفاده قرار می‌گیرند.

به گزارش قدس آنلاین، مدل‌های زبان بزرگ یا (LLM) نوعی هوش مصنوعی هستند که می‌توانند زبان انسان را تقلید کنند آن ها از مدل‌های آماری برای تجزیه و تحلیل حجم وسیعی از داده‌ها، یادگیری الگوها و ارتباطات بین کلمات و عبارات استفاده می‌کنند به طوری که برای تولید پاسخ‌های انسان‌مانند در ورودی‌ها، مدل‌های زبانی حجم عظیمی از متن را که اغلب از اینترنت گرفته شده است، تجزیه و تحلیل می‌کنند سپس چت‌بات‌ها به‌خوبی تنظیم می‌شوند تا با دریافت بازخورد از افراد، مکالمات بهتری داشته باشند. چت جی‌پی‌تی یکی از بزرگترین چت بات‌هایی است که در سراسر جهان استفاده می‌شود و داده‌های زیادی به زبان انگلیسی در اختیار دارد اما تعدادی از کشورها سعی دارند مدل‌های زبانی بومی خود را با توجه به زیرساخت‌های خود گسترش دهند تا این فناوری تنها در انحصار کشورهای انگلیسی زبان نباشد و از طرف دیگر به منابعی غنی با زبان خود دسترسی داشته باشند؛ یکی از این کشورها چین است که توانسته با توسعه یک مدل زبانی در این زمینه پیشرو باشد و با ساخت یک مدل جدید به زبان چینی به رقیبی جدی برای چت جی‌پی‌تی تبدیل شود و از آنجا که دسترسی به چت جی‌پی‌تی در چین ممکن نیست، این چت بات نیازها و اولویت‌های مردم چین را در حوزه مالی و آموزشی بهتر برآورده می‌کند.

مدل‌های زبانی بزرگ برای فعالیت خود از عناصر و فرآیندهای متعددی بهره می‌گیرند به‌عنوان نمونه، شبکه‌های عصبی عمیق یکی از عناصر اصلی در ساختار مدل‌های زبانی بزرگ است. این شبکه‌ها با تعداد زیادی لایه و راه‌های انتقالی، اطلاعات زبانی را در خود جمع کرده و پردازش می‌کنند همچنین مدل‌های زبانی بزرگ از یادگیری انتقالی بهره می‌برند یعنی ابتدا با استفاده از متون بزرگ آموزش داده می‌شوند و در مرحله بعد، این دانش از طریق وزن‌دهی به کلمات و جملات به مدل‌های کوچک‌تر منتقل می‌شود همچنین با استفاده از فنون یادگیری تقویتی و تعامل با داده‌های جدید، می‌تواند خود را بهبود بخشد و با آموزش مدل به تعداد بیشتری از داده‌ها، دقت و کارایی آنها بهتر می‌شود.

امروزه مدل‌های زبانی بزرگ کاربردهای فراوانی پیدا کرده‌اند و به‌شکل گسترده در ترجمه ، تولید محتوای خودکار، تشخیص احساسات متون، پاسخ‌دهی به سوالات، تفسیر متون، پشتیبانی مشتریان و بسیاری دیگر از کاربردها در حوزه هوش مصنوعی و پردازش زبان طبیعی مورد استفاده قرار می‌گیرند.

مدل‌های زبانی بزرگ با استفاده از شبکه‌های عصبی و یادگیری انتقالی، توانایی‌های زبانی پیشرفته‌ای از جمله تشخیص الگوهای زبانی، ترجمه ماشینی، تولید متون خودکار، پاسخ‌دهی به سوالات، تشخیص احساسات و بسیاری از وظایف دیگر را دارند مدل‌های زبانی در حین آموزش، با دریافت داده‌های بزرگ و متنوع از متون، قادر به یادگیری ساختارها، نمادها و ارتباطات مختلف زبانی شدند و با استفاده از فرآیند یادگیری عمیق، الگوها و ساختارهای زبانی را از داده‌های آموزشی استخراج می‌کنند. مدل‌های زبانی بزرگ هنوز نمی‌توانند به طور کامل با توانایی‌های انسانی در درک و تولید متون رقابت کنند. ممکن است آنها در درک مفهوم کلی متن، تشخیص اطلاعات کلیدی، و تولید متون معقول عملکرد خوبی داشته باشند، اما در مواردی که نیاز به درک عمیق‌تر ارتباطات مفهومی، تفسیر معانی ضمنی، و تخصص وجود دارد دچار چالش‌های جدی می‌شوند؛

با وجود توانمندی‌های بزرگی که مدل‌های زبانی بزرگ دارند، همچنان چالش‌هایی نیز وجود دارد. به عنوان مثال، نیاز به داده‌های آموزشی بزرگ و متنوع، مشکلات ناشی از ترجمه نادرست در متون پیچیده، و تصمیم‌گیری اخلاقی در مورد تولید محتوای متنی، از جمله این چالش‌ها هستند همچنین با توجه به تغییرات سریع در حوزه پردازش زبان طبیعی و تولید محتوای جدید، مدل‌های زبانی بزرگ نیز نیازمند به‌روزرسانی پیوسته و تطابق با نوآوری‌های روز هستند.

در عمل، مدل‌های زبانی بزرگ می‌توانند به تحلیل و تفسیر متون پزشکی، مقالات علمی، مطالب آموزشی، خبرها و سایر منابع دانش بالینی کمک کنند. بااین‌حال، باید توجه داشت که این مدل‌ها عمدتاً از دیدگاه زبانی به این دانش نگاه می‌کنند و تخصص بالینی علمی‌تر و تخصصی‌تری که توسط افراد متخصص در زمینه‌های مختلف انجام می‌شود نیاز به تخصص انسانی دارد.

رمین آژده نیا کارشناس هوش مصنوعی و پردازش تصویر پیرامون مدل‌های زبانی بزرگ گفت: مدل‌های زبانی مانند شبکه‌های عصبی هستند که به طور پیوسته و در ارتباط با هم عمل می‌کنند به این صورت که مدل‌ها به حجم عظیمی از دیتا متصل می‌شوند و این دیتاها که بسیار بزرگ هم هستند پردازش می‌شوند اما موضوع دیگری که بسیار اهمیت دارد این است که دیتاها از کجا جمع آوری می‌شوند مثلا سایت‌ها در شرکت «اوپن‌ ای آی» دیتا را به مدل یاد می‌دهد که توسط انسان‌های مختلف و دیتا سنترهای مختلف قابل پذیرش شده است و الگوریتم آن مشخص است.

وی در پاسخ به این سوال که کشور ما چگونه در این زمینه توانسته عمل کند افزود: متاسفانه در کشور ما زیرساخت‌های خاصی در جهت جمع آوری داده وجود ندارد و صرفا یک سری کار دانشجویی انجام شده که کافی نیست اما در کشورهای پیشرفته این زیرساخت‌ها از قبل در نظر گرفته شده که الان در حال استفاده از آن هستند ، موضوع دیگر بحث تحریم‌ها، مشکلات اقتصادی و نداشتن قطعات است که بتوانیم در نهایت خروجی قابل قبولی داشته باشیم بنابراین علاوه بر علم و دانش دسترسی به دیتاها قوی و سخت افزارهای کافی اهمیت زیادی دارد.

با گسترش روزافزون فناوری و توجه ویژه به ارتقاء پیدا کردن مدل‌های بزرگ زبانی در دنیا لازم است در کشور ما به این موضوع به صورت ویژه پرداخته شود و سه موضوع سخت افزار، داده، اطلاعات و الگوریتم از مهم‌ترین پایه‌های مدل‌های زبانی است و لازمه فراهم شدن این موارد تربیت نیروی انسانی موثر است؛ نیروی انسانی هوشمند و ماهر نقش مهمی در توسعه ابزارهای مختلف دارد و استفاده از نیروهای جوان نخبه در حل مساله ‌ها باید در اولویت قرار بگیرد.

منبع: آنا